* this script removes irrelevant owners found via search in JSCReg
* these owners include state agencies, depositories/custodians, stock exchanges, brokerages, NGOs, charities, soccer clubs, etc. 
use corp_owners_from_JSCReg.dta, clear

* define dummies for different types of irrelevant owners based on identifiers
if _N > 0 {
* state agencies
gen state=.
replace state=1 if id==19030825
replace state=1 if id==13741
replace state=1 if id==13747462
replace state=1 if id==10000000
replace state=1 if O_URSTAT=="Органи державної влади" | O_URSTAT== "Особи, уповнов.органами держ.влади"
replace state=1 if id==19442
replace state=1 if id==19020407
replace state=1 if id==32129
replace state=1 if id==21368158
replace state=1 if id==31387149
replace state=1 if id==32945
replace state=1 if id==255032
replace state=1 if id==21638284
replace state=1 if id==20055032
replace state=1 if id==22883141
replace state=1 if id==20495280
replace state=1 if id==13327990
replace state=1 if id==13511245
replace state=1 if id==13398493
replace state=1 if id==20984091
replace state=1 if id==23148337
replace state=1 if id==21295778
replace state=1 if id==2898152
replace state=1 if id==36860
replace state=1 if id==23826636
replace state=1 if id==24115972
replace state=1 if id==24121079
replace state=1 if id==22504
replace state=1 if id==4051327
replace state=1 if id==19028107
replace state=1 if id==20121941
replace state=1 if id==20513486
replace state=1 if id==13785103
replace state=1 if id==32112
replace state=1 if id==4398882
replace state=1 if id==24946503
replace state=1 if id==24411541
replace state=1 if id==13576948
replace state=1 if id==13467337
replace state=1 if id==24812116
replace state=1 if id==24958630
replace state=1 if id==13238
replace state=1 if id==41482
replace state=1 if id==22286899
replace state=1 if id==23205029
replace state=1 if id==62857
replace state=1 if id==701613
replace state=1 if id==730980
replace state=1 if id==732973
replace state=1 if id==915202
replace state=1 if id==13578893
replace state=1 if id==2550006
replace state=1 if id==9321020
replace state=1 if id==24740635
replace state=1 if id==3365860
replace state=1 if id==21149445
replace state=1 if strpos(name, "ФОНДУ ДЕРЖАВНОГО МАЙНА")
replace state=1 if strpos(name, "МІСЬКА РАДА")
replace state=1 if strpos(name, "РАЙОННА ДЕРЖАВНА АДМIНIСТРАЦIЯ")
replace state=1 if strpos(name, "ВИКОНАВЧИЙ КОМIТЕТ")
replace state=1 if strpos(name, "ДЕРЖАВНА АДМІНІСТРАЦІЯ")
replace state=1 if strpos(name, "МІСЬКОЇ РАДИ")
replace state=1 if id==8592193
replace state=1 if id==33833561

* depositories/custodians
gen depository=.
replace depository=1 if O_URSTAT=="Ном. утримувачi ЦП - депозитарiї" | O_URSTAT=="Ном. утримувачi ЦП - зберiгачi"
replace depository=1 if id==24917996
replace depository=1 if id==6

* stock/commodity exchanges
gen birzha=.
replace birzha=1 if id==30057700
replace birzha=1 if id==23527394
replace birzha=1 if id==32614167
replace birzha=1 if id==31762536
replace birzha=1 if id==32603616
replace birzha=1 if id==30458125
replace birzha=1 if id==24466246
replace birzha=1 if id==23914889
replace birzha=1 if id==23936603
replace birzha=1 if id==25065881
replace birzha=1 if id==23456808
replace birzha=1 if id==31904017
replace birzha=1 if id==22926761
replace birzha=1 if id==21596072
replace birzha=1 if id==24350147
replace birzha=1 if id==30736919
replace birzha=1 if id==25369156
replace birzha=1 if id==22858255
replace birzha=1 if id==14281095
replace birzha=1 if id==22861932
replace birzha=1 if id==22338923
replace birzha=1 if id==23513038
replace birzha=1 if id==20115415
replace birzha=1 if id==23155739
replace birzha=1 if id==20068738
replace birzha=1 if id==24778589
replace birzha=1 if id==25901112
replace birzha=1 if id==24056962
replace birzha=1 if id==25340553
replace birzha=1 if id==21653380
replace birzha=1 if id==23467723
replace birzha=1 if id==13298478
replace birzha=1 if id==23590760
replace birzha=1 if id==25675153
replace birzha=1 if id==30106752
replace birzha=1 if id==30220318
replace birzha=1 if id==20064500
replace birzha=1 if country==804 & strpos(name, "БІРЖА")

* brokerages
replace birzha=1 if id==13446660
replace birzha=1 if id==23704123
replace birzha=1 if id==23728336
replace birzha=1 if id==32436077

* NGOs
gen ngo=.
replace ngo=1 if id==35145
replace ngo=1 if id==14276094
replace ngo=1 if id==30359792
replace ngo=1 if id==22932046
replace ngo=1 if id==35895
replace ngo=1 if id==25192549
replace ngo=1 if id==25884804
replace ngo=1 if id==25967387
replace ngo=1 if id==30210907
replace ngo=1 if id==25604420
replace ngo=1 if strpos(name, "ГРОМАДСЬКА ОРГАНІЗАЦІЯ")
replace ngo=1 if id==14280492

* soccer clubs
gen socc=.
replace socc=1 if id==305981
replace socc=1 if id==169816
replace socc=1 if country==804 & strpos(name, "ФУТБОЛ")

* unions/associations
gen union=.
replace union=1 if id==16307261
replace union=1 if id==30323521
replace union=1 if id==2754654
replace union=1 if id==21683606
replace union=1 if id==21846528
replace union=1 if id==24361798
replace union=1 if id==10808
replace union=1 if id==22823943
replace union=1 if id==20057976
replace union=1 if id==31281591
replace union=1 if id==14273983
replace union=1 if id==20063014
replace union=1 if id==30075379
replace union=1 if id==21593493
replace union=1 if id==453285
replace union=1 if id==20923712
replace union=1 if id==31906627
replace union=1 if id==32091240
replace union=1 if id==21388557
replace union=1 if id==20124773
replace union=1 if id==24914779
replace union=1 if id==23385445
replace union=1 if id==25624768
replace union=1 if id==24006757
replace union=1 if id==21685491
replace union=1 if id==14295913
replace union=1 if id==13671397
replace union=1 if id==2606362
replace union=1 if id==2605204
replace union=1 if id==1035621
replace union=1 if id==466164
replace union=1 if id==14479
replace union=1 if id==36897
replace union=1 if id==453351
replace union=1 if id==14360357
replace union=1 if id==463131
replace union=1 if id==848138
replace union=1 if id==1044985
replace union=1 if id==32091240
replace union=1 if id==3081460
replace union=1 if id==20097616
replace union=1 if id==22049320
replace union=1 if id==2659370
replace union=1 if id==21958530
replace union=1 if id==697550
replace union=1 if id==20064315
replace union=1 if id==3451826
replace union=1 if id==22506622
replace union=1 if id==20245904
replace union=1 if id==23243892
replace union=1 if id==25662357
replace union=1 if id==20618216
replace union=1 if id==5510303
replace union=1 if id==22883495
replace union=1 if id==24853546
replace union=1 if id==16307261
replace union=1 if id==22923277
replace union=1 if id==30100441
replace union=1 if id==13322745
replace union=1 if id==13486292
replace union=1 if id==5581272
replace union=1 if id==14023826
replace union=1 if id==4540762
replace union=1 if id==25662357
replace union=1 if id==191804
replace union=1 if id==24748186
replace union=1 if id==23243892
replace union=1 if strpos(name, "АСОЦІАЦІЯ")
replace union=1 if id==23294180

* charities
gen char=.
replace char=1 if id==20061943
replace char=1 if id==21662099
replace char=1 if id==25890555
replace char=1 if id==25687883
replace char=1 if id==34884
replace char=1 if id==21515470
replace char=1 if id==20062440
replace union=1 if id==21515470
replace char=1 if strpos(name, "БЛАГОДIЙНИЙ ФОНД")
replace char=1 if strpos(name, "БЛАГОДІЙНИЙ ФОНД") 

* consumer and other unions
gen cunion=1 if strpos(name, "СПОЖИВЧЕ ТОВАРИСТВО")
replace cunion=1 if strpos(name, "СПІЛКА СПОЖИВЧИХ")
replace cunion=1 if strpos(name, "ТРУДОВИЙ КОЛЕКТИВ")
replace cunion=1 if strpos(name, "СПОЖИВЧА СПIЛКА")
replace cunion=1 if strpos(name, "СПIЛКА СПОЖИВЧИХ ТОВАРИСТВ")
replace cunion=1 if strpos(name, "СПОЖИВЧИХ ТОВАРИСТВ")
replace cunion=1 if strpos(name, "РАЙОННОГО СПОЖИВЧОГО ТОВАРИСТВА")
replace cunion=1 if strpos(name, "ОБЛСПОЖИВСПIЛКИ")
replace cunion=1 if strpos(name, "СПIЛКИ СПОЖИВЧИХ ТОВАРИСТ")
replace cunion=1 if strpos(name, "УКООПСПIЛКИ")
replace cunion=1 if id==1744286
replace cunion=1 if id==1744760
replace cunion=1 if id==1748686
replace cunion=1 if id==1758087
replace cunion=1 if id==1758762
replace cunion=1 if id==1708959
replace cunion=1 if id==1559123

* check dummies
tab state
tab depository
tab birzha
tab union
tab char
tab socc
tab ngo
tab cunion

* drop irrelevant owners
drop if state==1 | depository==1 | birzha==1 | union==1 | char==1 | socc==1 | ngo==1 | cunion==1
drop if id==0

* drop duplicates of owner-firm pairs
sort id name prev_id country
quietly by id name prev_id country: gen dup = cond(_N==1,0,_n) 

if _N > 0 {
drop if dup>1 & id!=.
drop dup
}

* drop temporary variables
drop state depository birzha union char socc ngo cunion O_URSTAT
}

* save cleaned-up data
save corp_owners_from_JSCReg_clean.dta, replace
